Техническое задание.

Инвесторы из фонда «Shut Up and Take My Money» решили попробовать себя в новой области и открыть заведение общественного питания в Москве. Заказчики ещё не знают, что это будет за место: кафе, ресторан, пиццерия, паб или бар, — и какими будут расположение, меню и цены. Для начала они просят вас — аналитика — подготовить исследование рынка Москвы, найти интересные особенности и презентовать полученные результаты, которые в будущем помогут в выборе подходящего инвесторам места. Постарайтесь сделать презентацию информативной и лаконичной. Её структура и оформление сильно влияют на восприятие информации читателями вашего исследования. Выбирать инструменты (matplotlib, seaborn и другие) и типы визуализаций вы можете самостоятельно. Вам доступен датасет с заведениями общественного питания Москвы, составленный на основе данных сервисов Яндекс Карты и Яндекс Бизнес на лето 2022 года. Информация, размещённая в сервисе Яндекс Бизнес, могла быть добавлена пользователями или найдена в общедоступных источниках. Она носит исключительно справочный характер.

Исследование рынка заведений общественного питания города Москвы.

Введение. Знакомство с проектом.

Цель проекта.

Произвести анализ рынка предприятий общественного питания города Москва на предмет наличия мест в городе, подходящих для открытия потенциально прибылных точки или точек общественного питания. Сделать прогноз типа предприятия общественного питания, способного приносить прибыль в нынешних условиях города. При проведении исследования учесть популярный тренд открытия кофейни.

Описание данных.

В файле, предоставленном для исследования (информация с заведениями общественного питания Москвы), содержатся следующие данные:

План работы.

Часть 1. Изучение общей информации о предоставленных данных. Подготовка данных для последующей обработки.

Общие выводы по разделу.

Часть 2. Анализ данных.

Производим исследовательский анализ данных с визуализациями.

Общие выводы по разделу.

Часть 3. Детализация исследования под конкретную задачу - открытие кофейни.

Детализируем исследование: открытие кофейни.

Общие выводы по разделу.

Общие выводы по проекту и презентация для инвесторов.

Часть 1. Изучение общей информации о предоставленных данных. Подготовка данных для последующей обработки.

Подготовим данные для обработки.

Вывод: Явные дубликаты в данных отсутствуют. При проверке неявных дубликатов выяснено, что по полю "название заведения" дубликатов 2792; по полю "адрес" дубликатов 2653. Выдвинем предположение, что это сетевые заведения (или заведения из категории кафе без особого названия - просто "кафе") и скопления заведений на фудкортах в торговых центрах. Предположения проверим в ходе дальнейшего анализа. Обрабатывать эти дубликаты не будем. После приведения двух столбцов к нижнему регистру по параметрам названия и адреса выявлено 4 неявных дубликата. При проверке по четырём параметрам количество неявных дубликатов сократилось до 1. Такое количество неявных дубликатов - менее 0,1% не критично для последующего анализа данных.

Выполним предобработку данных.

Создадим столбец street с названиями улиц из столбца с адресом.

Создадим столбец is_24/7 с обозначением, что заведение работает ежедневно и круглосуточно (24/7).

Общие выводы по разделу:

В предоставленных данных 8406 наименований предприятий общественного питания города Москва. Полные дубликаты отсутствуют. При проверке неявных дубликатов выяснено, что по полю "название заведения" дубликатов 2792; по полю "адрес" дубликатов 2653. Выдвинем предположение, что это сетевые заведения и скопления заведений на фудкортах в торговых центрах. Предположения проверим в ходе дальнейшего анализа. Обрабатывать эти дубликаты не будем. После приведения двух столбцов к нижнему регистру по параметрам названия и адреса выявлено 4 неявных дубликата. При проверке по четырём параметрам количество неявных дубликатов сократилось до 1. Такое количество неявных дубликатов - менее 0,1% не критично для последующего анализа данных.

Мы создали в таблице 2 новых столбца: один содержит названия улицы, где находится заведение, другой - с указанием на круглосуточную работу заведения (значение 1, иначе - 0). Это понадобится для последующей работы с данными.

В данных 16 столбцов: первые пять в формате объект - название, категория, адрес, округ города, время работы и улица. Последующие 2 - широта и долгота - в формате float64. в таком же формате - столбец с рейтингом предприятия. В колонке "время работы", 6,38% пропусков, но есть ещё значение "нет информации", которое не учтено при подсчёте nan. Остальные из перечислкенных столбцов пропусков не имеют. В колонке, определяющей уровнь цен в заведении, пропусков более 60%. Последующие 3 колонки взаимосвязаны: определяющей будет avg_bill - в последующих двух наличие значения будет зависеть от категории записи в определяющей колонке. В колонке avg_bill 54,6% пропусков, в последующих двух - суммарно больше.Следует учесть, что в колонке avg_bill встречается значение: цена бокала пива, а колонки со средним значением для такой записи нет. Колонка chain пропусков не имеет. В колонке seats пропусков почти 43%. Во вновь созданных столбцах пропуски отсутствуют.

Заполнять пропуски не будем.

Форматы присутствующие в данных: float64(6), int64(2), object(8).

Часть 2. Анализ данных.

Распределение заведений по категориям.

Вывод. На графике видно, что лидируют такие типы заведений общественного питания, как кафе, рестораны и кофейни, пиццерии только на пятом месте.

Распределение посадочных мест.

Исследуем размеры заведений, опираясь на количество посадочных мест.

Проиллюстрируем выводы графиками.

Вывод: основная масса заведений предлагает до 50 посадочных мест, при этом заведений, в которых готовы принть до 22 гостей одновременно - абсолютное большинство (75%). Заведений, предлагающих от 50 до 80, а также от 110 до 150 посадочных мест немного больше, чем заведений,где посадочных мест от 90 до 110 и от 150 до 173. В общей сумме таких заведений менее 20%.

Посмотрим,существенна ли разница между типами заведений по количеству посадочных мест.

Признаем "выбросами" заведения с количеством мест более 173 и посмотрим на соотношение посадочных мест по типам заведений города.

Вывод. Типы заведений не очень сильно различаются по количеству посадочных мест.

Распределение заведений на сетевые и не сетевые. Определение ТОП-15 сетей в Москве.

Вывод. 38,1% заведений являются сетевыми (3205 единиц). До четверти сетевых заведения состоят всего из 1 торговой точки (возможно, заведения той же сети есть в других городах). Среднее количество точек в сети -4, максимальное - 120. При этом всего 1% сетевых заведений имеет более 42 точек в Москве.

Судя по графику распределения сетевых заведений по категориям - лидируют кафе, рестораны и кофейни. При этом если рассматривать долю сетевых заведений среди общего количества - в лидерах будут булочные (61%), пиццерии (52%) и кофейни. В быстром питании сетевых заведений всего 38%. Тренды меняются, и,видимо, Макдональд'C - больше не ресторан.

При сравнении доли круглосуточных заведений среди всех и среди сетевых, можно сказать что она меньше почти на 2 процента (15,06% и 13,39% соответственно.

Определим самые большие сети.

Вывод. Почти половина самых популярных (сетевых с самым большим количеством точек) заведений в регионе (45,6%) по типу заведения являются кофейнями. Кафе (11,6%) и булочные (3,3%) по типу предлагаемого меню близки к кофейням, хотя их ассортимент более разнообразен (не только сладости и десерты).

Довольно популярны рестораны (20,1%) и пиццерии (19,5%). Самые крупные сетевые рестораны Яндекс Лавка, Prime и Теремок. Самые крупные пиццерии Домино'с Пицца и Додо Пицца.

Таким образом,среди самых популярных сетей 3 ресторана, 2 пиццерии, 3 кафе, 1 булочная - всё остальное - кофейни. Самая крупная сеть кофеен - Шоколадница. При этом география этой сети тоже весьма обширная: у нас в Краснодаре тоже есть заведения этой сети.

Заведения быстрого питания, столовые и бары,пабы отсутствуют среди самых популярных сетей.

Распределение категорий заведений по округам.

Отобразим общее количество заведений и количество заведений каждой категории по районам города.

Вывод. Распределение заведений по типам по округам примерно одинаковое. Количество пиццерий, быстрого питания, столовых и булочных настолько незначительное, что есть соблазн определить их все в категорию "прочие". Количесатво баров, пабов значительно только в Центральном административном округе. Этот округ резко выделяется среди прочих административных округов, он - самый густонаселённый, при этом здесь 4 позиции категорий заведений по количеству представлены значительно. В остальных административных округах таких позиций 3. Выделяется также Северо-Западный административный округ с самым маленьким количеством заведений. Стоит обратить внимание на количество кофеен. В значениях на графике по этой позиции самый большой разнобой по районам города, но везде они стабильно занимают третью позицию.

Визуализация распределения средних рейтингов заведений и средних чеков заведений.

Визуализируем распределение средних рейтингов по категориям заведений.

Вывод. Максимально высокий средний рейтинг заведений в Центральном административном округе (4,33 - 4,38), а самый низкий (4,10)- в Юго-Восточном административном округе. На севере столицы (Северный административный округ) средний рейтинг заведений 4,24 - 4.29; в Северо-Западном административном округе - 4,19 - 4,24. В остальных округах столицы средний рейтинг заведений одинаковый - 4,15 - 4,19.

Усреднённые рейтинги в разных типах общепита различаются мало.

Исследуем медианный средний чек заведений по районам.

Вывод. Средний чек в Западном и Центральном округах достигает 1000 рублей. По мереудалённости от центра в сторону северо-запада он снижается до 700-650 рублей, а при удалении от центра в южную и восточную стороны - до 600 - 450 рублей. При удалении от центра города цены снижаются существенно.

Определение ТОП-15 улиц по количеству заведений.

Найдём ТОП-15 улиц по количеству заведений.

Вывод.

При определении ТОП-15 улиц по количеству заведений общепита мы вывели 16 позиций, поскольку Проспект Мира проходит через 2 административных округа: Северо-Восточный и Центральный.

Определение улиц с единственным заведением.

Исследуем улицы, на которых находится только один объект общепита.

Вывод: Всего улиц с единственным заведением в столице - 458. Больше всего таких улиц в Центральном административном округе (145), меньше всего - в Юго-Западном административном округе (18).

Детально рассмотреть расположение этих улиц и заведений на них можно на карте с маркерами (раскомментировать код).

Средние размеры этих заведений - 60 посадочных мест, не имеют посадочныхмест до 5% заведений.

Среди категорий заведений преобладают кафе, рестиораны и кофейни. Меньше всего пиццерий и булочных.

Доля круглосуточных заведений 12,66%.

Общие выводы по разделу.

Часть 3. Детализация исследования под конкретную задачу - открытие кофейни.

Детализируем исследование: открытие кофейни. Определим:

Сднлпем общие выводы.

Количество кофеен в данных.

Распределение кофеен по округам.

Режим работы кофеен.

Рейтинг кофеен и стоимость чашки капуччино.

Рейтинг кофеен по округам города применрно равный. Разброс значений рейтинга присутсвует, но он небольшой. Заметен он в Северо-Западном и Юго-Восточном округах.

Вывод Такким образом, самый дорогой кофе у нас на западе, юго-западе и в центре столицы.

Общие выводы по разделу.

Часть 4. Общие выводы по проекту и презентация для инвесторов.

Общие выводы.

Задача: Основателям фонда «Shut Up and Take My Money» не даёт покоя успех сериала «Друзья». Их мечта — открыть такую же крутую и доступную, как «Central Perk», кофейню в Москве. Будем считать, что заказчики не боятся конкуренции в этой сфере, ведь кофеен в больших городах уже достаточно. Попробуйте определить, осуществима ли мечта клиентов.

Выводы: Мечта заказчиков осуществима хотя бы по правилу трёх "Н" - Нет Ничего Невозможного.

Опираясь на результаты исследования - считаю,что изобретать что-то принципиально новое будет очень затратно, в том числе, в плане времени. Тем более, что интерес заказчика в определённом направлении выражен конкретно. Инвесторы не одиноки в интересе к сериалу "Друзья" и месту действия - кофейне. Данная идея уже нашла своё воплощение.

Рекомендация:

Вариант рекомендации Создать свою альтернативную сеть кофеен по мотивам популярного сереала в количестве не менее 3-х точек в Центральном, Западном и Юго-Западном округах.

Презентация для инвесторов.

презентация для инвесторов здесь: